Was ist TriviaQA?

Definition Was ist TriviaQA?

08.12.2022 Von Dipl.-Ing. (FH) Stefan Luber

TriviaQA ist ein Datensatz zum Testen des Leseverständnisses und der Fähigkeit zum Beantworten von Fragen. Er kommt für Benchmarks von Sprachmodellen zum Einsatz und besteht aus 95.000 Frage-Antwort-Paaren mit 650.000 zugehörigen Nachweistexten. Entwicklungsziel von TriviaQA war es, schwer zu beantwortende Fragen mit hoher syntaktischer und lexikalischer Variabilität zusammenzustellen. Die Beantwortung erfordert ein Verständnis längerer Textpassagen und die Fähigkeit zu logischen Schlussfolgerungen.

TriviaQA ist der Name eines von der University of Washington und dem Allen Institute for Artificial Intelligence in Seattle entwickelten und zusammengestellten Textdatensatzes. Er wurde 2017 veröffentlicht und lässt sich zum Testen des Leseverständnisses und der Fähigkeit zum Beantworten von Fragen einsetzen. Der Datensatz ist für Benchmarks von Sprachmodellen und deren NLP-Fähigkeiten nutzbar. TriviaQA ist sehr groß und besteht aus 95.000 Frage-Antwort-Paaren und 650.000 zugehörigen Nachweistexten. Die durchschnittliche Länge einer Frage liegt bei 14 Wörtern.

Eine Besonderheit dieses Datensatzes ist es, dass die Nachweistexte unabhängig von den Frage-Antwort-Paaren gesammelt wurden. Im Schnitt gibt es zu jedem Frage-Antwort-Paar sechs Nachweistexte. Die Fragen von TriviaQA haben eine hohe syntaktische und lexikalische Variabilität. Antworten auf die Fragen sind nicht leicht zu finden und erfordern das Verständnis längerer Textpassagen. Durch die Schwierigkeit der Beantwortung der Fragen möchten die Entwickler den kontinuierlich steigenden Fähigkeiten moderner Sprachmodelle Rechnung tragen. In Benchmarks mit älteren Datensätzen wie dem Stanford Question Answering Dataset (SQuAD) erreichen die Sprachmodelle Ergebnisse im hohen 90-Prozentbereich und übertreffen die menschliche Leistung bei weitem.

Mittlerweile erreichen NLP-Modelle auch bei TriviaQA eine höhere Leistung als der Mensch. Die Entwicklung immer komplexerer Datensätze schreitet daher voran. Einer dieser Datensätze ist HotpotQA von der Carnegie-Mellon-Universität, Stanford-Universität und Universität von Montreal. Nach wie vor ist TriviaQA aber ein wichtiger und häufig für Leseverständniswettbewerbe von Künstlicher Intelligenz und maschinellem Lesen eingesetzter Datensatz.

Motivation für die Entwicklung und Erstellung von TriviaQA

Das Beantworten von Fragen zählt zu den Fähigkeiten bestimmter Sprachmodelle. Die richtigen Antworten auf die Fragen zu finden und aus Referenztexten zu extrahieren, erfordert ein gutes Textverständnis. Fragen können komplex gestellt sein und ein logisches Denken und Schlussfolgern erfordern. Ein Sprachmodell mit Künstlicher Intelligenz muss zur Beantwortung auf bereits erworbenes Wissen zurückgreifen oder aus vorhandenen Texten und Textpassagen die Antworten extrahieren. Um die Fähigkeit der Sprachmodelle zu testen, wurden Datensätze wie SQuAD entwickelt. Die Datensätze enthalten Fragen, Antworten und Nachweistexte, in denen die Antworten enthalten sind.

Durch die Fortschritte auf dem Gebiet der Künstlichen Intelligenz und des maschinellen Lernens erreichen leistungsfähige Modelle oft schon nach kurzer Zeit hervorragende Ergebnisse und machen die Entwicklung immer herausfordernder Testdatensätze erforderlich. TriviaQA ist einer dieser Datensätze und stellt NLP-Modelle vor neue Herausforderungen. Zur Beantwortung der gestellten Fragen müssen die Modelle mehrere Texte und verschiedene Textarten wie Nachrichten, Wikipedia-Texte und Blog-Artikel analysieren. Längere Textpassagen müssen in der Inferenz bewältigt und verstanden werden. Als TriviaQA 2017 veröffentlicht wurde, lagen damals aktuelle Sprachmodelle hinter der menschlichen Leistung zurück. Mittlerweile erreichen NLP-Modelle auch bei TriviaQA bessere Leistungen als der Mensch.

Erstellung, Aufbau und Inhalt von TriviaQA

Ziel bei der Entwicklung und Erstellung von TriviaQA war die Schaffung eines Datensatzes mit schwer zu beantwortenden Fragen. Die Fragestellungen sollte komplex und mit hoher lexikalischer und syntaktischer Variabilität sein. TriviaQA besteht aus insgesamt 95.000 Frage-Antwort-Paaren. Die durchschnittliche Länge einer Frage liegt bei 14 Wörtern und einer Antwort bei zwei Wörtern. Für jedes Paar sind circa sechs Nachweistexte vorhanden, mit deren Hilfe das Sprachmodell die Fragen beantworten soll. Eine Besonderheit von TriviaQA ist, dass die Nachweistexte unabhängig von den Frage-Antwort-Paaren gesammelt wurden und dadurch quasi von der Fragestellung entkoppelt sind.

Die Fragen und Antworten stammen von Internet-Quiz- und Trivia-Seiten. Zu diesen Fragen wurden mithilfe automatisch generierter Suchstrings beispielsweise über die Suchmaschine Bing entsprechende Nachweistexte gesammelt. Die Nachweistexte stammen teils aus Wikipedia-Texten aber auch von anderen Webseiten. Neben enzyklopädischen Texten handelt es sich bei den Nachweistexten zum Beispiel um Nachrichtentexte und Blog-Artikel. Die Nachweistexte sind hinsichtlich des Fehlens korrekter Antwort gefiltert. Antworten auf die Fragen sind zu circa 93 Prozent Überschriften in Wikipedia und zu circa vier Prozent numerische Ausdrücke. Der Rest sind freie Formulierungen mit verschiedenen Wörtern.

Vergleich mit anderen Datensätzen

Von anderen Datensätzen für ähnliche Zwecke unterscheidet sich TriviaQA durch den komplexen Aufbau der Fragestellungen. Durch die Entkopplung zwischen dem Sammeln der Fragen und dem Sammeln der Nachweistexte besteht eine hohe lexikalische und syntaktische Variabilität zwischen den Fragestellungen und den zugehörigen Antworttextpassagen. Die Sprachmodelle benötigen ein gutes Verständnis auch längerer Textpassagen und müssen über verschiedene Texte und Sätze hinweg logisch schlussfolgern. Im Vergleich zu SQuAD enthält TriviaQA dreimal mehr Fragen, bei denen das Sprachmodell über mehrere Sätze schlussfolgern muss. Der in der Inferenz zu berücksichtigende Kontext ist wesentlich länger und Antworten sind nicht durch einfache Vorhersagen zu finden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.

(ID:48834053)